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$ü 要 : [目的 /意义 ] 准确 高 效 地 获取 马匹 体 尺 信息 是 马 产业 现代 化 进程 中 的 关键 环节 。 传 统 的 人 工 测量 方法 耗 
时 长 、 工 作 量 大 ， 且 会 对 马匹 造成 一 定 应 激 反应 。 因 此 ， 实 现 准 确 且 高 效 的 体 尺 参数 自动 测量 对 于 制定 蒙古 马 早 
期 育种 计划 至 关 重 要 。[ 方 法 ] 选择 Azure Kinect 深 度 相 机 获取 蒙古 马 双 侧 RGB-D 数 据 ， 以 YOLOv8n-pose 为 基础 ， 
通过 在 C2f 模 块 中 引入 可 变形 卷 积 (Deformable Convolution v2, DCNv2), ， 同 时 添加 洗 牌 注意 力 机 制 (Shuffle Atten- 
tion, SA) 模块 和 优化 损失 函数 (SCYLLA-IoU Loss, SIoU) 的 方法 ， 利 用 余弦 退火 法 动态 调整 学 习 率 ， 提 出 一 种 名 
为 DSS-YOLO (DCNv2-SA-SIoU-YOLO) 的 模型 用 于 蒙古 马 体 尺 关键 点 的 检测 。 其 次 ,将 RGB 图 中 的 二 维 关键 点 


坐标 与 深度 图 中 对 应 深度 值 相 结合 ， 得 到 关键 点 三 维 坐标 ， 
样 一 致 性 (Random Sample Consensus, RANSAC)、 统 计 离 


并 实现 蒙古 马 点 云 信息 的 转换 。 利 用 直通 滤波 、 随 机 
群 值 滤波 、 主 成 分 分 析 法 (Principal Component Analy- 


sis, PCA) 完成 点 云 处 理 与 分 析 。 最 终 根 据 关键 点 坐标 自动 计算 体高 、 体 斜 长 、 臂 高、 胸围 和 丑 围 5 项 体 尺 参 数 。 


[结果 和 讨论 ] DSS-YOLO 的 平均 关键 点 检测 精度 为 92.5%; 


di 为 7.2 个 像素 ; 参数 量 和 运算 量 分 别 仅 为 3.48 M 和 


9.1 G。 体 尺 参数 自动 测量 结果 与 人 工 测量 值 相 比 ， 各 项 体 尺 参数 的 整体 平均 绝对 误差 为 3.77 cm; 平均 相对 误差 为 
2.2996, [SRY] 研究 结果 可 为 蒙古 马 运动 性 能 相关 遗传 参数 的 确定 提供 技术 支撑 。 
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内 蒙古 自治 区 被 誉 为 蒙古 马 故 乡 ， 有 着 悠久 的 
养 马 、 育 马 及 赛马 等 文化 传统 ， 拥 有 发 展现 代 马 业 
深厚 的 文化 底蕴 和 优越 的 地 理 环境 与 气候 条 件 。 蒙 
二 马 作为 内 蒙古 自治 区 马匹 的 优良 品种 已 有 上 千年 
的 历史 ， 一 直 是 中 国 的 一 种 重要 资源 ， 被 农业 农村 
部 列 为 国家 级 畜 禽 遗传 资源 保护 名 录 之 一 "。 近 年 
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来 ， 内 蒙古 传统 养 马 业 正在 逐渐 朝 着 集 文 化 、 经 
济 、 休 闲 于 一 体 的 新 型 第 三 产业 发 展 ， 对 于 地 方 马 
品种 资源 有 效 保护 、 开 展 优良 选 育 工 作 以 及 充分 控 
掘 优良 种 质 特征 已 经 成 为 了 发 展 过 程 中 的 关键 环 
节 中 。 动 物 育种 的 中 心 任务 是 对 数量 性 状 的 改良 ， 
其 中 体 扩 参数 在 蒙古 马 育 种 工作 中 具有 重要 地 位 ， 
能 够 直接 反映 其 生长 发 育 情况 和 品种 改良 效果 “*。 
体 尺 参数 的 不 同 可 能 导致 运动 学 特征 参数 及 动力 学 
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参数 的 变化 ， 进 而 影响 马匹 运动 性 能 CU. SAME 
的 体 尺 参数 测量 方法 主要 通过 手动 测量 完成 。 该 方 
法 不 仅 效率 低 、 工 作 量 大 、 自 动 化 程度 不 高 而 且 易 
造成 马匹 的 应 激 反应 “。 而 快速 、 精 准 、 高 效 的 测 
量 方法 是 突破 这 一 困境 的 关键 手段 。 

随 着 现代 测试 技术 不 断 发 展 ， 运 用 先进 技术 获 
取 马 匹 体 尺 参数 并 评估 其 形态 特征 ， 以 制定 育种 计 
划 成 为 当下 的 主流 研究 方向 7? , Kristjansson 等 
对 影响 冰岛 马 的 骑 行 能 力 的 不 同形 态 特 征 的 遗传 关 
系 进行 评估 ， 结 果 表 明 ， 可 通过 育种 方式 改进 体型 
性 状 以 达到 提高 冰岛 马 的 骑 行 能 力 。Pallottino 
等 使 用 立体 视觉 系统 ， 通 过 手动 方式 测量 利 比 
赞 马 的 体 尺 参数 ,结果 显示 测量 误差 小 于 3%。 
Gmel 55: >! fii Hi tpsDig2 图 像 分 析 工 具 由 操作 人 员 
手动 测量 提取 弗 赖 伯 格 马 的 各 项 体 尺 参数 ， 并 采用 
限制 性 最 大 似 然 模型 估计 体 尺 参数 的 遗传 率 。 
Pérez-Ruiz 5 |"! 采用 LiDAR (Light Laser Detection 
and Ranging) (ERAR ae IAF P8 NE ST i OT 
进行 三 维 重 建 操作 ， 通 过 手动 缩放 的 方式 测量 体 尺 
参数 ， 得 到 人 工 测量 值 与 三 维 重建 测量 值 的 平均 相 
KABA 0.55, Freitag | | 人 研究 在 美国 夸 特 马 左 
侧 放 置 标记 物 ， 并 结合 ImageJ 图 像 分 析 软 件 ， 通 过 
人 工 标 记 的 方式 测量 相应 的 体 尺 参 数 ， 测 量 结果 平 
均 相 对 误差 小 于 1.5%。 上 述 人 研究 表明 ， 通 过 图 像 处 
理 方法 获取 体 尺 参数 并 用 于 马匹 育种 计划 的 制定 是 
可 行 的 。 然 而 ， 上 述 方法 主要 依赖 于 人 工 手动 选择 
测量 点 ， 过 程 复杂 且 自 动 化 程度 低 。 快 速 、 精 准 、 
高 效 的 测量 方法 已 成 为 推进 马匹 育种 进程 的 关键 
手段 。 

近年 来 ， 得 益 于 人 体 姿 态 佑 计 领 域 的 进展 ， 国 
内 外 学 者 将 基于 卷 积 神经 网 络 的 关键 点 检测 方法 应 
用 于 家 冀 关 键 点 的 实时 自动 检测 研究 中 ， 并 取得 了 
HERR Lif Teng" AJH Hourglass {I zE 
175 ^F A LL EIK F A 89 T BEY eas EL. Wang 
4 "€ 通过 构建 HRNet (High-Resolution Network) 
模型 实现 检测 生猪 站 立时 的 关节 点 。Zheng 等 "以 
活 种 鸡 为 试验 对 象 ， 提 出 种 鸡 小 腿 长 周 长 测量 算法 
(Shank Length and Circumference Measurement, SL- 
CM)。 该 算法 首先 利用 YOLOv5s (You Only Look 
Once) 模型 检测 鸡 扑 和 小 腿 根 部 区 域 ， 其 次 定位 区 
域 中 的 关键 点 ， 进 而 计算 种 鸡 大 腿 体 尺 参 数 。 赵 宇 
亮 等 ' 利用 DeepLabCut 工 具 箱 实 现 生猪 背部 点 云 


中 测量 点 的 检测 定位 ， 从 而 完成 对 应 体 尺 测量 。 

上 述 研 究 中 ， 家 畜 体 尺 测 量 多 是 依赖 单 侧 图 像 
数据 ， 胸 于 等 重要 三 维 体 尺 参数 无 法 获取 。 此 外 ， 
关键 点 检测 模型 复杂 程度 较 高 、 泛 化 性 不 足 ， 在 养 
殖 环境 中 较 难 实践 应 用 。 针 对 以 上 问题 ， 本 研究 对 
YOLOv8n-pose 模 型 进行 改进 ， 提 出 一 种 新 的 检测 
模型 DSS-YOLO (DCNv2-SA-SIoU-YOLO) 关键 
点 检测 模型 ， 并 结合 点 云 数据 处 理 方法 ， 通 过 检测 
蒙古 马 三 维 点 云 中 测量 点 位 置 ， 实 现 体高 、 体 斜 
长 、 丑 高、 胸围 和 辟 围 5 项 体 尺 参 数 的 自动 测量 ， 
为 高 效 、 精 准 的 蒙古 马 体 尺 测 量 方 案 提 供 技 术 支 持 
和 参考 依据 。 


1 材料 与 方法 


1.1 数据 集 构建 


本 研究 数据 分 别 于 2022 年 10 月 和 2023 年 4 月 、 
9 月 在 内 蒙古 农业 大 学 马匹 养殖 技术 中 心 处 采集 。 
图 像 数 据 采 集 设备 为 Azure Kinect 深 度 相 机 (RGB 
图 分 辩 率 为 1 920X1 080 像 素 ; 深度 图 分 辩 率 为 
640X576 像 素 ; 帧 率 为 30 FPS), 采集 对 象 为 处 于 
适宜 育种 阶段 的 成 年 蒙古 马 ， 年 龄 (7+1.5) 岁 ， 
体重 (485450) kg。 拍 摄 处 于 不 同 场景 、 时 间 段 
下 的 行走 或 站 立 的 单 匹 蒙古 马 完整 侧 视 RGB 图 像 
视频 ， 共 采集 50 匹 蒙古 马 ， 每 段 视 频 时 长 为 15 一 
25 s， 视 频 保存 为 *.mp4 格 式 ， 用 于 构建 训练 集 和 
验证 集 ， 以 完成 DSS-YOLO 关 键 点 检测 模型 的 训练 
及 性 能 评估 。 另 外 采集 30 匹 蒙古 马 RGB-D 图 像 用 
于 构建 测试 集 ， 以 完成 体 尺 参数 测量 任务 。 
1.1.1 训练 集 和 验证 集 构 建 

将 采集 到 的 50 段 RGB 图 像 视频 设置 10 帧 /s 抽 
取 处 理 ， 并 经 人 工 筛选 剔除 重复 、 严 重 遮挡 等 质量 
不 佳 图 像 ， 共 获取 2 500 张 高 清 的 蒙古 马 RGB 图 
像 ， 其 中 处 于 运动 行走 和 休息 站 立 状态 的 马匹 图 像 
数量 比例 为 1 : 1。 为 了 保证 模型 的 谤 化 性 ， 并 考虑 
实际 图 像 捕捉 过 程 中 存在 角度 、 光 线 和 图 像 模 糊 的 
问题 ， 利 用 几何 变换 、 亮 度 调 节 以 及 噪声 添加 对 原 
始 数据 集 进 行 增强 操作 ， 最 终生 成 包含 4 000 幅 图 
像 的 蒙古 马 图 像 数 据 集 ， 用 于 DSS-YOLO 模 型 的 训 
练 及 性 能 评估 。 按 照 8 : 2 的 比例 将 标注 完成 的 数 
据 集 分 为 训练 集 及 验证 集 ， 其 中 训练 集 和 验证 集 分 
别 为 3 200 张 和 800 张 。 利 用 Labelme 图 像 标 注 软 
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件 ' 站 ， 以 蒙古 马 的 各 个 测量 点 为 参考 对 数据 集 进 1.2 总 体 技 术 路 线 图 


行 标注 ， 如 图 1 所 示 。 


注 :1. 体高 ;2. KOK. 2454. 胸围 ;5. 臂 围 ;a. 肩 部 端点 ;b. SY 


sc. TIERS 8,5 sd. ERSTES E se. 肘 部 端点 ;f. 趴 关节 点 。 
图 1 蒙古 马 体 尺 参数 测量 图 示 及 标注 
Fig. 1 Diagram and illustration of Mongolian horse body 


sizes Measurement 


1.1.2 ”测试 集 构建 

在 试验 场景 中 ， 采集 30 匹 蒙古 马 用 于 体 尺 参 
数 测量 任务 。 由 于 训练 员 每 日 会 牵引 一 定数 量 的 蒙 
十 马 往返 于 马帮 和 训练 场地 ， 为 了 在 不 干预 养殖 场 
日 常 工作 的 前 提 下 进行 数据 采集 ， 本 研究 在 马帮 内 
通道 两 侧 各 安装 一 台 Azure Kinect 深 度 相 机 ， 在 每 
匹 马 往返 时 经 过 相机 前 进行 采集 ， 共 获得 60 组 
RGB-D 图 像 数 据 。 为 了 减少 拍摄 过 程 中 相机 的 拌 
动 现 象 ， 利 用 三 角 文 架 对 其 进行 了 固定 ， 蒙 古 马 深 
度 信息 采集 平台 布局 如 图 2 所 示 。 采 集 完 成 后 由 专 
业 人 员 利 用 卷 尺 、 测 杖 等 工具 测量 30 匹 马 的 体高 、 
体 斜 长 、 导 高、 胸围 和 臂 围 5 项 参数 。 每 项 体 尺 参 
数 共 测 3 次 ， 取 均值 作为 人 工 测 量 值 。 


副 相 机 


图 2 蒙古 马 深度 信息 采集 平台 布置 
Fig. 2 Platform layout of Mongolian horse deep 


information collection 


总 体 技术 路 线 如 图 3 所 示 ， 主 要 由 DSS-YOLO 
关键 点 检测 模型 和 三 维 点 云 处 理 模 块 组 成 。 首 先 ， 
搭建 双 侧 图 像 采 集 试验 平台 ,采集 蒙古 马 RGB 图 
像 和 深度 图 像 。 其 次 ， 运 用 DSS-YOLO 检 测 体 尺 测 
量 的 关键 点 信息 并 映射 至 同步 采集 的 深度 图 中 ， 得 
到 关键 点 深度 信息 ， 并 对 深度 图 像 进 行 点 云 信 息 转 
换 ， 以 获取 蒙古 马 三 维 点 云 数 据 。 最 终 ， 通 过 标定 
信息 完成 蒙古 马 双 侧 点 云 的 配 准 和 后 续 处 理 操作 ， 
并 根据 关键 点 计算 各 项 所 需 体 尺 参 数 。 


DSS-YOLO 


图 3 蒙古 马 体 尺 参数 自动 测量 研究 技术 路 线 图 


Fig. 3 Overall technology roadmap for automated measurement 


of body size parameters of Mongolian horses 


1.3 关键 点 检测 模型 的 改进 


YOLOv8 是 YOLO 系 列 中 最 新 版 本 ， 相 较 于 前 
代 版 本 ， 该 模型 拥有 最 高 的 检测 精度 及 速度 OP, 
此 外 ，YOLOv8 推 出 YOLOv8-pose 单 阶段 关键 点 检 
测 模型 ， 网 络 结构 主要 包括 输入 端 、Backbone 主干 
网 络 Neck 颈 部 网 络 以 及 检测 头 中。 其 中 ，YO- 
LOv8n-pose 因 其 较 小 的 计算 资源 和 模型 内 存 需求 而 
具备 轻 量 级 特性 ， 故 本 研究 选用 YOLOv8n-pose 作 
为 基础 模型 。 由 于 初始 YOLOv8n-pose 是 针对 人 体 
关节 点 检测 定位 从 而 实现 行为 识别 任务 的 预测 模 
型 ， 考 虑 自制 蒙古 马 关 键 点 数据 集 的 特性 ， 在 除 关 
键 点 数目 的 变化 之 外 ， 拟 从 以 下 3 个 方面 对 YO- 
LOv8n-pose 进行 改进 ， 以 应 对 识别 对 象 特征 的 差 
5, 具体 改进 如 下 。 

1) 在 原始 YOLOv8n-pose 模 型 的 Backbone 网 
络 中 ， 将 C2f 模 块 与 可 变形 卷 积 (Deformable Con- 
volution v2, DCNv2) 融合 ,设计 C2f_DCN 模 块 结 
构 ， 以 帮助 模型 能 够 更 好 地 捕捉 在 不 同 姿 势 下 的 马 
匹 形状 信息 。 

2) 在 Neck 网 络 中 添加 SA 洗 牌 注意 力 机 制 
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(Shuffle Attention, SA) 注意 力 机 制 模块 ， 通 过 在 通 
道 信息 和 空间 信息 两 个 层面 提取 特征 ， 能 有 效 提高 
模型 特征 表达 能 力 ， 抑 制 噪声 特征 ， 从 而 提升 检测 
的 准确 性 。 

3) 将 损失 函数 优化 为 考虑 角度 代价 的 边界 损 


AK PKB (SCYLLA-IoU, SIoU), ， 加 快 模型 训练 时 的 
收敛 速度 的 同时 ， 增 强 模型 对 主要 图 像 区 域 的 关注 
度 ， 有 助 于 降低 关键 点 检测 的 错误 率 。 改 进 后 的 网 
络 结构 如 图 4 所 示 。 


Backbone 


oe | 


采样 操作 ;Maxpool 为 最 大 池 化 操作 ;SPPF 为 快速 空间 金字 塔 池 化 。 


图 4 DSS-YOLO 网 络 结构 
Fig. 4 The network structure of DSS-YOLO 


1.3.1 可 变形 卷 积 

传统 卷 积 核 的 感受 野 有 限 ， 无 法 捕获 足够 的 局 
部 信息 ， 从 而 影响 最 终 检测 结果 。DCNv2 是 Zhu 
等 2 提出 的 可 变形 卷 积 网 络 ， 通 过 为 卷 积 核 添 加 
不 同 的 偏 移 量 ， 从 而 允许 卷 积 核 在 不 同 的 采样 位 置 
添加 偏 移 变量 ， 可 根据 不 同 数据 学 习 成 为 不 同 的 卷 
积 核 结 构 ， 以 更 好 捕捉 目标 的 不 规则 形状 和 局 部 变 
化 。 其 计算 过 程 如 公式 (1) 所 示 。 


y(p)= > or x(p + py + Ap): Am, (1) 


AP: @; 为 位 置 k 上 的 卷 积 核 权 重 ; x 为 输入 
特征 映射 ;已 为 预先 指定 的 偏 移 量 ; Am 为 可 学 习 
的 偏 移 量 ;Am 为 权重 系数 ， 取 值 范 围 为 [0，1]。 
鉴于 3X3 卷 积 核 在 捕捉 局 部 特征 方面 的 关键 作用 ， 
以 及 Backbone 网 络 在 特征 提取 方面 的 重要 性 ， 
此 本 人 研究 通过 将 Backbone 中 后 3 个 C2f 模 块 中 的 
3X3 卷 积 核 替 换 为 DCNv2， 从 而 设计 构建 
C2f DCN 模块 中 。 改 进 后 的 网 络 结构 如 图 5 所 示 。 
这 一 改进 旨 在 通过 可 变形 卷 积 的 高 级 特征 提取 能 
力 ， 以 帮助 模型 适应 实际 养殖 环境 中 的 不 同 姿势 下 
马匹 关键 点 的 检测 需求 。 

1.3.2 注意 力 机 制 模块 

注意 力 模块 能 够 有 效 地 提高 卷 积 神经 网 络 模型 

捕捉 输入 数据 中 特定 区 域 或 元 素 的 能 力 ， 从 而 实现 


图 5 C2f_DCN 模块 
Fig. 5 C2f_DCN module 
更 有 效 、 准 确 地 预测 或 表征 。 在 本 人 研究 中 ， 通 过 添 
加 SA 注意 力 模 块 用 于 提高 模型 对 特征 信息 的 专注 


度 ， 同 时 过 滤 宛 人 杂 信 息 所 ， 其 网 络 结构 如 图 6 所 
示 。 此 外 ，SA 具有 高 度 的 灵活 性 可 以 被 添加 到 任 
何 卷 积 层 的 末端 。 

本 研究 设计 在 Neck 网 络 中 的 C2f 卷 积 模块 之 后 
添加 SA 注意 力 模块 。 该 设计 可 以 提高 模型 在 不 同 
阶段 对 于 特征 信息 的 关注 程度 ， 进 而 提升 关键 点 检 
测 准 确 度 。 

18.8 ”损失 函数 

YOLOv8n-pose 采用 完全 交 并 比 损失 (Com- 
plete IoU Loss, CIoU) All 4 4i 5X R f Fit K P Zt 
(Distribution Focal Loss, DFL) ^ 作为 边界 框 损失 
PK COE fg ut REM HE EL SC HE Zn RI PE, [H 
CIoU 并 没有 明确 考虑 预测 框 的 宽度 和 高 度 不 能 同 
时 按 一 定 比 例 收敛 ， 从 而 导致 预测 框 与 真实 框 之 间 
存在 着 方向 上 的 差异 ， 导 致 模型 训练 时 的 收敛 效果 
较 差 .进一步 导致 训练 结果 不 理想 。 针 对 该 问题 ， 
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c, = signoid(x) 


F, 
图 6 SA 模块 


Z | à © 


e. 
F, -Wx b 


Fig. 6 SA module 


本 研究 采用 SIoU 作为 边界 框 损失 函数 。SIoU 考 
虑 预测 框 与 真实 框 之 间 的 矢量 角度 、 距 离 、 形 状 及 
IoU 成本， 由 于 本 研究 着 重 于 中 大 型 目标 检测 ， 而 


标 ， 需 将 其 转换 为 真实 环境 中 的 三 维 坐 标 ， 以 实现 
蒙古 马 三 维 点 云 中 各 项 体 尺 参数 自动 测量 。 通 过 
Azure Kinect SDK "" 中 的 校准 函数 ， 将 RGB 图 与 


且 自 定义 的 关键 点 均 处 在 边界 框 内 ， 提 高 边界 框 
准确 度 有 助 于 降低 关键 点 检测 错误 率 。 定 义 如 公 
式 (2) 所 示 。 
pN by 
bUb, 
式 中 : 4 为 距离 成 本 ; 2 为 形状 成 本 ; 2 为 预测 
KE; b, 为 真实 框 。 角 度 成 本 示意 图 如 图 7 所 示 ,，o 
为 真实 框 中 心 点 与 预测 框 之 间 的 欧式 距离 。 在 训练 
过 程 中 ， 如 果 向 量 夹 角 aswn/4， 损失 孔 数 则 将 优先 
沿 x 轴 方向 预测 ， 使 "最 小 化 ， 相 反 则 沿 着 y 轴 进 
行 预测 ， 使 得 8 最 小 化 。 因 此 ，SIoU 函数 规定 了 预 
测 框 向 真实 框 通 近 的 方向 ， 避 免 了 训练 过 程 中 出 现 
的 预测 框 “徘徊 ”现象 ， 可 进一步 加 快 模型 训练 中 
的 收敛 速度 。 


L,,-1-IoU + (Q+4)/2, | IoU- (2) 


图 7 角度 成 本 示意 图 


Fig. 7 Schematic diagram of angle cost 
1.4 三 维 点 云 转换 
由 于 DSS-YOLO 所 检测 得 的 关键 点 为 二 维 坐 


对 应 深度 图 进行 对 齐 校正 ， 并 将 关键 点 信息 映射 到 
相同 时 间 点 拍摄 得 到 的 深度 图 中 ， 得 到 关键 点 深度 
信息 "你 。 随 后 ， 实 现 深度 图 中 的 像素 坐标 转换 为 
世界 坐标 系 下 的 三 维 坐 标 得 到 点 云 数据 。 计 算 过 程 
基于 公式 (3) 实现 ， 具 体 转 换 步 又 如 图 8 所 示 。 
: f 0 ce, 
Ziv|=|0 f, |Y. (3) 
1 0 0 I1j|-Z. 

WHP: (u, vy) 为 点 像素 坐标 ; (x，y) 为 点 图 像 
坐标 ; (XX.，Y.，2,) 为 该 点 在 相机 坐标 系 下 的 三 维 
坐标 ; (e. c) NARA ABD; Cf. F) HHL 
焦距 。 


空间 关键 点 坐标 
AUK qz 


相机 坐标 系 


像素 坐标 系 
图 8 三 维 点 云 坐标 系 转换 关系 示意 图 


Fig. 8 Three-dimensional point cloud coordinate System 


transformation relationship diagram 


1.5 蒙古 马 点 云 处 理 与 分 析 


利用 立体 标定 后 输出 的 两 侧 Azure Kinect 深度 
相机 的 相对 位 置 参数 完成 双 侧 点 云 配 准 重 建 。 将 主 
相机 视角 作为 世界 坐标 系 ， 通 过 旋转 和 平移 副 相 机 
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生成 的 点 云 信息 ， 得 到 全 局 点 去 数据 ， 该 过 程 基于 
AX OD 执行 。 本 研究 中 设 定 主 相机 视角 作为 世 
界 坐 标 系 ， 全 局 点 云 配 准 效果 如 图 9 所 示  。 


X, x| [n] [R, R Rl] |e 
yi -R Y» T t, = R, R, R, y» E f, 
Zi Za t. R, R; RJ 2, t 


(4) 

式 中 : (x, yo z) A ETHBL AER A PIR 

(225 Yo Zo) A VA ALTE BI A p PER; RK 为 空间 变 
POEM; [to t, tL AFB a. 


图 9 实际 养殖 环境 下 的 蒙古 马 点 云 全 局 配 准 效果 
Fig.9 Global alignment effect of Mongolian horse point cloud 


in real breeding environment 


鉴于 Azure Kinect 深度 相机 的 高 分 辨 率 和 广角 
度 测 量 距离 ， 在 获得 的 点 云 数 据 中 存在 较 多 噪声 和 
无 效 点 云 数据 ， 影 响 体 尺 参数 测量 精度 。 为 确保 测 
量 准 确 性 ， 本 研究 采取 下 述 点 云 处 理 操作 。 

D 对 点 云 配 准 结果 使 用 直通 滤波 ， 在 拍摄 通 
道 的 3 个 真实 坐标 维度 (X 轴 、Y 轴 、Z 轴 ) 中 设置 
国 值 ， 以 保留 目标 蒙古 马 的 点 云 区 域 。 

2) 由 于 蒙古 马 图 像 是 在 其 运动 过 程 中 拍摄 的 ， 
因此 利用 随机 采样 一 致 性 (Random Sample Con- 
sensus, RANSAC) 算法 检测 地 平面 点 云 位 置信 息 并 
确定 其 对 应 的 方程 ， 用 于 体高 类 参数 测量 。 拟 合 后 
的 地 平面 点 云 如 公式 (5) 所 示 。 

Ax+By+Cz+D=0 (5) 

AP: A、B、C、DD 为 平面 方程 系数 ; xyz 
为 点 云 坐标 。 

3) 经 直通 滤波 和 RANSAC 人 处 理 后 的 点 云 仍 存 
在 着 较 多 噪声 数据 。 为 减少 噪声 点 云 对 胸围 和 臂 转 
测量 精度 的 影响 ， 利 用 统计 离 群 值 滤波 去 除 存 在 于 
背景 中 及 游离 在 体 表 周围 的 离 群 点 云 。 

4) KAMERI HTE (Principal Component 
Analysis, PCA) 对 蒙古 马 点 云 进行 体 尺 参数 测量 坐 


标 系 校正 。 将 点 云 质心 位 置 设 为 坐标 原点 ， 同 时 将 
地 平面 点 云 法 向 量 的 正方 向 设 为 了 Y 轴 ， 体 长 的 正方 
向 设 为 X 轴 ， 并 根据 右手 定 则 ， 将 体 宽 方向 设 为 Z 
轴 ， 以 便于 后 续 体 斜 长 测量 操作 。 


1.6 体 尺 参数 测量 


1.6.1 体 斜 长 参数 计算 

为 避免 空间 中 点 与 点 之 间 的 倾斜 程度 影响 体 斜 
长 参数 的 测量 结果 ， 本 研究 将 点 a 和 点 d 投 影 至 经 
坐标 系 校正 后 的 XO7 平 面 上 ， 进 行 体 斜 长 参数 工 的 
计算 ， 如 公式 (6) 所 示 。 

L-2J(x,-x)-e-(y,-yY *(z-zY (6) 

KH: (x, yo 21) 为 点 a 坐标 ; (xa yo 2) 
点 4 坐标 。 
16.2 ”体高 和 臀 高 参数 计算 

根据 RANSAC 检测 得 到 的 地 平面 点 云 信息 ， 
计算 点 5 和 点 c 到 地 面 的 直线 距离 即 为 对 应 体高 、 
辟 高 测量 值 ， 如 公式 (7) 所 示 。 

ja | Ax' + By'+ Cz'+ D| 

7 JA +B +C 

式 中 : HARRA R EU ae (AL, cm; Ax + 
By + Cz + DON Wl ez 7r (x, y cA DAM 
点 c 的 坐标 。 
1.6.3 胸围 和 臀 围 参数 计算 

分 别 利 用 点 5、e 和 点 c、f 的 相对 位 置 关系 对 点 
云 模型 做 切片 操作 ,得 到 胸围 和 辟 围 的 轮廓 点 云 信 
息 。 由 于 蒙古 马 胸 围 和 丑 围 呈现 不 规则 的 几何 特 
征 ， 利 用 常规 的 圆 形 曲 线 拟 合 方法 计算 周 长 可 能 
致 较 大 的 测量 误差 。 因 此 ， 本 研究 将 点 云 切片 中 的 
各 点 信息 转换 至 极 坐标 系 中 ， 并 利用 移动 最 小 二 乘 
法 对 极 坐 标 系 中 连续 的 点 云 数 据 进行 曲线 拟 合 。 随 
后 ,将 拟 合 完 成 的 曲线 再 次 转换 至 稍 卡 尔 坐 标 系 
下 ， 从 而 得 到 胸围 和 辟 围 的 周 长 信 息 。 曲 线 长 度 S 
计算 如 公式 (8) 所 示 。 

s=f Vir dr (8) 

RP: f (x) 为 拟 合 后 得 到 的 曲线 函数 ; fix) 
为 该 函数 的 导数 。 曲 线 拟 合 的 结果 如 图 10 所 示 。 
由 于 蒙古 马匹 背部 呈现 上 罕 下 宽 的 三 角形 态 ， 通 过 
对 臂 部 点 云 进行 剪 切 操作 ， 以 模拟 拍摄 过 程 可 能 出 
现 的 由 于 视角 受 限 导致 马匹 背部 或 腹部 深 处 点 云 捕 
获 不 全 ， 从 而 辟 部 上 、 下 侧 点 云 会 出 现 部 分 缺失 的 


(7) 
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情况 。 剪 切 后 的 曲线 拟 合 结果 如 图 11 所 示 ， 与 理想 表 1 训练 试验 平台 配置 参数 
点 云 情况 相 比 ， 曲 线 拟 合 长 度 平均 相对 误差 为 Table 1 Configuration parameters of the training platform 
2.34%， 误 差 较 小 ， 证 明了 移动 最 小 二 乘 拟 合 曲线 配置 版 本 
法 的 有 效 性 。 操作 系统 Ubuntu 20.04 
600 i 深度 学 习 框 架 PyTorch 1.11.0 
aa pe a Le 中 央 处 理 器 Intel Core i7-9700 k 
400} 400 Mele, 
30} ^ 100 a BA 图 像 处 理 器 Nvidia GeForce RTX 2080 ti 
g 200 g 200 I 
id E Pu d { CUDA 11.3 
o / H H CUDNN 82.1 
-100| A rd -100 V P 
A Sprea : 100 200 300 400 ut ~ 0 100 200 300 400 22 评价 指标 
a. I] B b. FH 


图 10 蒙古 马 胸 、 臂 围 点 云 切 片 及 曲线 拟 合 示意 图 
Fig. 10 Schematic diagram of point cloud slicing and curve fit- 
ting of Mongolian horse chest and croup circumference 
600 600. 
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a. 背部 点 云 孔洞 补 全 b. 腹部 点 云 孔洞 补 全 
图 11 蒙古 马 背 部 和 腹部 点 云 出 现 孔洞 情况 时 臂 部 曲线 拟 合 
示意 图 
Fig. 11 Schematic diagram of croup curve fitting with holes in 


the dorsal and ventral parts of the Mongolian horse point cloud 


2 结果 与 分 析 


2.1 试验 平台 与 训练 参数 设置 


初始 训练 参数 设置 如 下 : 初始 学 习 率 设置 为 
0.01， 学 习 率 动量 设置 为 0.937， 输 入 图 像 大 小 设置 


为 640X640， 批 量 大 小 设置 为 16， 权 重 衰 减 设 置 
为 0.000 5， 优 化 器 选择 AdamW， 训 练 轮 次 为 150 
个 epoch。 试 验 平台 配置 参数 如 表 工 所 示 。 模 型 训 
练 过 程 中 采用 余弦 退火 算法 动态 调节 学 习 率 ， 帮 助 
模型 更 有 效 地 收敛 ， 如 公式 (9) 所 示 。 


N min ) [1 + COS ( 


Un = T] nin 

式 中 : ,为 当前 学 习 率 ; 1 为 最 大 学 习 率 ; 
1 为 最 小 学 习 率 ,设置 为 0; 7 为 当前 运行 的 ep- 
och 数 ; 了 为 总 epoch 数 。 


1 Ts 
+ 2 Lus T, m)] (9) 


2.2.1 关键 点 检测 精度 评价 指标 

通过 引入 关键 点 相似 度 (Object Keypoint Simi- 
larity, OKS) 计算 得 出 关键 点 检测 平均 准确 率 CAv- 
erage Precision, AP) ， 其 作用 类 似 于 目标 检测 中 的 
IoU， 当 OKS 大 于 阔 值 7 时 ， 结 果 被 判别 为 真 阳性 
OKS 小 于 等 于 7 时 ， 结 果 被 判别 为 假 阳 性 ; OKS 4 
于 0 时 ， 结 果 被 判别 为 假 明 性 。 本 研究 计算 在 不 同 
T (从 0.5~0.95， 步 长 为 0.05) 下 的 AP 均值 作为 评 
MFR, IFEN mAP, 计算 如 公式 (10) 所 示 。 
> ,6(OKS, > T) 

,1 

同时 ， 统计 测 试 集中 预测 关键 点 与 真实 关键 点 
之 间 平 均 欧 式 距 离 ， 以 评估 模型 在 测试 集中 的 关键 
点 定位 精准 度 ， 如 公式 (11) 所 示 。 


dpss = 一 2I Xpi — X m 


WHP: dos 为 平均 误差 ; 7 为 图 像 中 关键 点 个 
Bs Gs Vp) Meg yo) 分 别 为 预测 点 的 像素 坐标 
和 人 工 标注 点 的 像素 坐标 。 
2.2.2 ” 体 尺 参数 测量 评价 指标 

采用 平均 绝对 误差 (Mean Absolute Error, 
MAE) 和 平均 相对 误差 (Mean Relative Error, 
MRE) 作为 体 尺 参数 测量 精度 的 评价 指标 ， 其 计算 
如 公式 (12) 和 公式 (13) 所 示 。 


mAP = (10) 


(x»,-») | aD 


T si 
MAE- x - x (12) 
100% «x, - x, 
MRE = 一 2 (13) 
Rp: i 为 图 像 序号 ; n 为 试验 数据 总 数 ; xoy 
自动 测量 值 ; x 为 人 工 测 量 值 。 
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2.3 模型 训练 及 验证 结果 分 析 


为 了 评估 改进 方法 优化 效果 ， 通 过 将 训练 过 程 
可 视 化 ， 对 比 训练 过 程 中 原 模 型 (YOLOv8n-pose) 
和 改进 后 模型 (DSS-YOLO) 的 精度 和 损失 变化 情 
况 ， 模 型 训练 过 程 如 图 12 所 示 。 可 以 看 出 在 经 过 
150 个 epoch 的 训练 周期 之 后 两 个 模型 精度 曲线 和 
损失 曲线 基本 达到 收 僵 ， 并 且 改 进 后 的 DSS-YOLO 
相 较 于 原 模 型 在 训练 过 程 中 的 收敛 速度 更 快 、 精 度 
更 高 ， 验 证 了 本 研究 改进 方法 的 有 效 性 。 改 进 对 比 
结果 总 结 于 表 2。 


mAP 


一 一 YOLOv8n-pose 
0.0 —— DSS-YOLO 


0 — N 6 720 EJ 


" 0 
epoch 
a. 精度 变化 曲线 


—— YOLOv8a-pose 
— DSS-YOLO 


x 120 150 


Ò 0 60 


epoch 
b. 损失 变化 曲线 

图 12 YOLOv8n-pose 和 DSS-YOLO 模型 训练 过 程 对 比 

Fig. 12 Comparison of YOLOv8n-pose and DSS-YOLO 


model training process 


3X2 YOLOv8n-pose #1 DSS-YOLO 性 能 对 比 结果 
Table 2 YOLOv8n-pose and DSS-YOLO performance 


comparison results 


模型 mAP/% 参数 量 /x10" M ”运算 量 /G 
YOLOv8n-pose 88.2 3.15 8.7 
DSS-YOLO 92.5 3.48 9.1 


Hj YOLOv8n-pose JH LE, DSS-YOLO 在 关键 点 
检测 精度 方面 提高 4.3%， 同 时 其 参数 量 和 运算 量 增 
加 相对 较 小 。 为 了 进一步 验证 本 研究 方法 的 鲁 棒 性 


和 适用 性 ， 横 拟 在 真实 养殖 环境 中 可 能 会 碰 到 相机 
抖动 和 过 曝 情 况 ， 并 观察 在 不 同 条 件 下 测试 集中 的 
关键 点 检测 效果 ， 如 图 13 所 示 ， 检 测 结果 于 表 3 所 
示 。 在 不 同 条 件 下 ，DSS-YOLO 均 能 凭借 较 小 的 计 
算 资 源 完 成 对 处 于 不 同 姿态 下 的 蒙古 马 测量 关键 点 
检测 ， 误 差 值 均 小 于 8.5 个 像素 ， 表 明 模 型 的 泛 用 
性 较 强 。 

表 3 DSS-YOLO 模型 对 测试 集中 不 同 条 件 下 的 RGB 图 检 

测 结果 统计 

Table 3 DSS-YOLO model detection results of RGB images 


under different conditions in test set 


模型 条 件 dbss/pixel 
高 质量 12.4 
YOLOv8n-pose 模糊 13.9 
曝光 15.2 
高 质量 72 
DSS-YOLO 模糊 7.9 
曝光 8.3 


2.4 不 同 关键 点 检测 模型 对 比试 验 结果 


为 了 进一步 评估 本 研究 模型 的 关键 点 检测 性 
HE. 分别 采用 目前 主流 的 关键 点 检测 模型 Hour- 
glass 、HRNet 和 SimCC， 并 基于 自制 关键 点 数据 集 
进行 训练 。 完 成 训练 后 ， 模 型 验证 最 终结 果 如 表 4 
所 示 ， 其 中 DSS-YOLO 的 mAP 值 为 922.35%， 相 比 于 
Hourglass, HRNet fll SimCC 分 别提 高 3.6% 、2.8% 
和 1.6%; dns 为 72， 相 比 于 其 余 模 型 分 别 减 小 8.2、 
5.4 和 3.2 个 像素 。 表 明 DSS-YOLO 模 型 的 检测 精度 
在 验证 集 或 测试 集中 都 有 着 较 高 精度 。 在 模型 轻 量 
化 方面 ， 参 数量 相 比 于 其 余 模 型 分 别 减少 91.36、 
25.04 和 23.26 M; 运算 量 相 比 于 Hourglass 和 HRNet 
分 别 减少 19.6 和 7.7 G。 


2.5 蒙古 马 点 云 重建 结果 分 析 


蒙古 马 点 云 最 终 重 建 结果 如 图 14 所 示 。 经 过 
一 系列 点 云 处 理 步 又 之 后 ， 与 全 局 点 云 相 比 ， 无 关 
的 背景 点 云 和 大 部 分 噪声 点 云 能 被 有 效 去 除 ， 同 时 
对 蒙古 马 三 维 点 云 中 与 体 尺 参数 测量 相关 的 信息 进 
行 分 析 和 提取 ， 获 得 了 高 精度 的 蒙古 马 体 表 点 云 信 
息 。 此 外 ， 通 过 将 点 云 质心 作为 坐标 系 原点 ， 设 定 
体 尺 参数 测量 坐标 系 ， 为 各 项 体 尺 参 数 的 自动 测量 
黄 定 了 良好 的 基础 。 
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| | |horge 0.93 
| 


" 13 


c. 曝光 条 件 
图 13 DSS-YOLO 模型 检测 效果 示例 
Fig. 13 Example of the detection effect of DSS-YOLO model 


表 4 不 同 关键 点 检测 模型 性 能 对 比 结果 
Table 4 Performance comparison of different keypoint 


detection models 


模型 mAP/% ”dbss/pixel 参数 量 /X10' M 运算 量 /G 
Hourglass 88.9 15.4 94.84 28.7 
HRNet 89.7 12.6 28.52 16.8 
SimCC 90.9 10.4 26.74 6.8 
DSS-YOLO 92.5 7.2 3.48 9.1 


2.6 体 尺 测量 结果 分 析 


为 验证 和 分 析 本 研究 提出 的 蒙古 马 体 尺 参数 自 
动 测 量 方法 精度 ， 以 测试 集 采集 时 的 人 工 测量 值 为 
参考 值 。 表 5 总 结 了 各 项 体 尺 参数 的 实际 测量 值 的 
MAE 和 MRE。 此 外 ,采用 箱 线 图 分 析 人 工 测 量 值 
与 自动 测量 值 的 绝对 误差 ， 如 图 15 所 示 。 箱 线 图 
能 够 直观 地 展示 测量 误差 的 整体 特征 ， 其 中 箱 体 表 
示 测 量 结果 的 绝对 误差 值 分 布 情况 ; 箱 体 的 中 间 线 


a. 点 云 斜视 图 
图 14 蒙古 马 点 云 重建 结果 


Fig. 14 The Mongolian horse point cloud reconstruction results 


b. 点 云 俯视 图 


代表 数据 中 位 数 ， 即 平均 绝对 误差 值 。 

统计 整体 测量 结果 的 MRE 为 2.29%，MAE 为 
3.77 cm。 其 中 ， 体 高 的 MRE 为 1.93%， 绝 对 误差 
控制 为 -4.41~-4.43 m; 体 斜 长 的 MRE 2.51%, 44 
对 误差 控制 为 -5.95~5.88 cm; BM MRE 为 
2.02%， 绝 对 误差 控制 为 -4.92~4.82 cm; 胸围 的 
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m5 蒙古 体 尺 参数 测量 结果 平均 绝对 误差 和 平均 相对 误差 
Table 5 The MAE and MRE of Mongolian horses body 


measurements 


需求 。 
2) 完成 蒙古 马 三 维 点 云 重建 与 处 理 分 析 后 ， 
基于 DSS-YOLO 模型 的 检测 结果 ， 可 实现 蒙古 马 体 


RER 体高 体 斜 长 sg 胸围 TERI 


MAE/cm 2.98 3.91 3.12 4.49 4.35 
MRE/% 1.93 2.51 2.02 2.46 2.51 


体高 (MK Cim ”胸围 "ES 

图 15 各 项 体 尺 参数 测量 结果 绝对 误差 箱 线 图 

Fig. 15 Box plots of MAE for each body measurements 
MRE 为 2.46%， 绝 对 误差 控制 为 -6.03~6.17 cm; 
T EAJ MRE 为 2.51%， 绝 对 误差 控制 为 -5.83~- 
6.16 cm. 

由 于 蒙古 马 的 不 同体 尺 参数 共享 相同 的 体 尺 测 
量 点 ， 基 于 轮廓 特征 点 的 关键 点 定位 方法 虽然 具有 
一 定 的 可 取 性 ， 但 是 该 方法 容易 受到 目标 马匹 姿 
势 、 养 殖 环境 及 设备 精度 等 因素 的 影响 ， 导 致 关键 
点 定位 不 准确 。 本 研究 构建 基于 卷 积 神经 网 络 的 二 
维 关键 点 检测 模型 ， 结 合 三 维 点 云 处 理 方法 ， 可 高 
效 、 准 确 地 获取 蒙古 马 自 然 状 态 下 的 体 尺 参数 。 


3 结 论 


为 提高 蒙古 马 体 尺 参数 测量 效率 ， 加 快 选 育 进 
程 ， 本 研究 提出 DSS-YOLO 模 型 结合 三 维 点 云 处 理 
的 体 尺 自动 检测 方法 ， 结 论 如 下 。 

1) 本 研究 在 YOLOv8n-pose 模 型 的 基础 上 , 38 
过 设计 C2f_ DCN 模块 ， 在 Backbone 网 络 中 融合 可 
变形 卷 积 (DCNv2); 在 Neck 网络 中 添加 SA 注意 
力 模块 ; 将 原始 损失 函数 蔡 换 为 SIoU， 在 模型 训 
练 过 程 中 采用 余弦 退火 法 动态 调节 学 习 率 。 改 进 后 
得 到 的 DSS-YOLO 模 型 参数 和 运算 量 分 别 为 3.48 M 
和 9.1 GFLOPs， 而 mAP 达 到 92.5%， 在 测试 集中 表 
现 出 较 高 的 预测 精度 。 结 果 表明 ，DSS-YOLO 模 型 
能 满足 真实 场景 中 蒙古 马 测 量 关键 点 的 自动 检测 


高 、 体 斜 长 、 臂 高 、 胸 围 和 辟 围 5 项 体 尺 参数 的 自 
动 测量 。 通 过 在 真实 场景 中 选取 30 匹 蒙古 马 进 行 
现场 测试 ， 各 项 体 尺 参数 的 MRE 为 2.29%，MAE 
为 3.77 cm。 表 明 本 研究 所 提出 的 方法 精度 较 高 ， 
可 满足 实际 生产 需求 。 

3) 本 研究 所 提出 的 模型 在 自制 数据 集 上 表现 
良好 ,但 在 应 对 不 同 毛色 、 场 景 下 的 蒙古 马 可 能 
现 不 佳 。 因 此 ， 后续 考虑 使 用 迁移 学 习 方法 训练 模 
型 ， 以 适应 各 种 可 能 的 马匹 毛色 和 更 加 丰富 的 真实 
养殖 环境 。 此 外 ， 由 于 本 人 研究 所 使 用 Azure Kinect 
相机 在 某 些 情况 下 存在 精度 误差 ， 后 续 研 究 考虑 采 
用 多 线 激光 雷达 结合 RGB 相机 ， 并 移植 深度 学 习 
模型 以 构建 蒙古 马 移动 测量 平台 ， 满 足 实 际 操作 中 
灵活 性 和 简便 操作 的 应 用 需要 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Automatic Measurement of Mongolian Horse Body Based on 
Improved YOLOv8n-pose and 3D Point Cloud Analysis 
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Abstract: 


[Objective] There exist a high genetic correlation among various morphological characteristics of Mongolian horses. Utilizing ad- 
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vanced technology to obtain body structure parameters related to athletic performance could provide data support for breeding institu- 
tions to develop scientific breeding plans and establish the groundwork for further improvement of Mongolian horse breeds. However, 
traditional manual measurement methods are time-consuming, labor-intensive, and may cause certain stress responses in horses. There- 
fore, ensuring precise and effective measurement of Mongolian horse body dimensions is crucial for formulating early breeding plans. 
[Method] Video images of 50 adult Mongolian horses in the suitable breeding stage at the Inner Mongolia Agricultural University 
Horse Breeding Technical Center was first collected. Fifty images per horse were captured to construct the training and validation sets, 
resulting in a total of 2 500 high-definition RGB images of Mongolian horses, with an equal ratio of images depicting horses in mo- 
tion and at rest. To ensure the model's robustness and considering issues such as angles, lighting, and image blurring during actual im- 
age capture, a series of enhancement algorithms were applied to the original dataset, expanding the Mongolian horse image dataset to 
4 000 images. The YOLOv8n-pose was employed as the foundational keypoint detection model. Through the design of the C2f_ DCN 
module, deformable convolution (DCNV2) was integrated into the C2f module of the Backbone network to enhance the model's adapt- 
ability to different horse poses in real-world scenes. Besides, an SA attention module was added to the Neck network to improve the 
model's focus on critical features. The original loss function was replaced with SCYLLA-IoU (SIoU) to prioritize major image re- 
gions, and a cosine annealing method was employed to dynamically adjust the learning rate during model training. The improved mod- 
el was named DSS-YOLO (DCNv2-SA-SIoU-YOLO) network model. Additionally, a test set comprising 30 RGB-D images of ma- 
ture Mongolian horses was selected for constructing body dimension measurement tasks. DSS-YOLO was used for keypoint detection 
of body dimensions. The 2D keypoint coordinates from RGB images were fused with corresponding depth values from depth images 
to obtain 3D keypoint coordinates, and Mongolian horse's point cloud information was transformed. Point cloud processing and analy- 
sis were performed using pass-through filtering, random sample consensus (RANSAC) shape fitting, statistical outlier filtering, and 
principal component analysis (PCA) coordinate system correction. Finally, body height, body oblique length, croup height, chest cir- 
cumference, and croup circumference were automatically computed based on keypoint spatial coordinates. 

[Results and Discussion] The proposed DSS-YOLO model exhibited parameter and computational costs of 3.48 M and 9.1 G, respec- 
tively, with an average accuracy mAP, soos reaching 92.5%, and a d,,, of 7.2 pixels. Compared to Hourglass, HRNet, and SimCC, 
mAP, sos; increased by 3.6%, 2.8%, and 1.6%, respectively. By relying on keypoint coordinates for automatic calculation of body di- 
mensions and suggesting the use of a mobile least squares curve fitting method to complete the horse's hip point cloud, experiments in- 
volving 30 Mongolian horses showed a mean average error (MAE) of 3.77 cm and mean relative error (MRE) of 2.2996 in automatic 
measurements. 

[Conclusions] The results of this study showed that DSS-YOLO model combined with three-dimensional point cloud processing meth- 
ods can achieve automatic measurement of Mongolian horse body dimensions with high accuracy. The proposed measurement method 
can also be extended to different breeds of horses, providing technical support for horse breeding plans and possessing practical appli- 


cation value. 
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